導(dǎo)讀:不抓取如何會(huì)收錄,又怎么有排名?然而就這樣一個(gè)明顯的問題,卻有大量的網(wǎng)站將其忽略掉。在A5這里做SEO診斷服務(wù)的客戶中,其中“20%”的網(wǎng)站都會(huì)存在抓取錯(cuò)誤,直接嚴(yán)重影響到網(wǎng)站
發(fā)表日期:2020-07-01
文章編輯:興田科技
瀏覽次數(shù):10338
標(biāo)簽:
不抓取如何會(huì)收錄,又怎么有排名?然而就這樣一個(gè)明顯的問題,卻有大量的網(wǎng)站將其忽略掉。在A5這里做SEO診斷服務(wù)的客戶中,其中“20%”的網(wǎng)站都會(huì)存在抓取錯(cuò)誤,直接嚴(yán)重影響到網(wǎng)站的成長效果。今天這篇文章,如果你有幸看到,希望可以閱讀完今天這篇文章,并分享出去,因?yàn)檎娴臅?huì)很有價(jià)值。
曾經(jīng)診斷過一個(gè)千萬級(jí)別收錄的站點(diǎn),但是索引總是被反復(fù)的剔除,又反復(fù)的收錄,企業(yè)一直找不到問題。可是當(dāng)我們對網(wǎng)站檢查之初就發(fā)現(xiàn)一個(gè)怪的現(xiàn)象了:
1、錯(cuò)誤的封禁
在百度的robots.txt的更新上,如果多次點(diǎn)擊“檢測并更新”就會(huì)出現(xiàn)時(shí)??梢愿?,但是又時(shí)常無法更新的問題。如此一來:不應(yīng)當(dāng)被收錄的東西,在robots.txt上禁止的被收錄了,又刪除就很正常了。那么它的問題是什么呢?并非服務(wù)器負(fù)載過度,而是因?yàn)榉阑饓﹀e(cuò)誤的將部分Baiduspider列入了黑名單。
上面這個(gè)例子是robots.txt方面的抓取錯(cuò)誤,作為站長最少應(yīng)該每周都檢查更新一下robots.txt是否可以正常更新。之后我們再看下“頁面抓取”方面的錯(cuò)誤:
2、服務(wù)器異常
常規(guī)的服務(wù)器就不說啦,大家都知道的,北上廣的一般都不錯(cuò)。不過有一些特殊服務(wù)器,想必絕大多數(shù)的站長都不知道吧?例如西部數(shù)碼的“港臺(tái)服務(wù)器”就很有趣,真的是港臺(tái)的嗎?本身機(jī)房在國內(nèi),還算什么港臺(tái)?為了逃避備案而用一個(gè)港臺(tái)的Ip,數(shù)據(jù)全部在國內(nèi)。
這樣有什么不好呢?我們會(huì)發(fā)現(xiàn):站點(diǎn)的服務(wù)器是經(jīng)過CDN的,哪怕是你上傳的一張圖片,都會(huì)顯示為“302狀態(tài)碼”,訪問速度是提升上去了,可是這樣利于SEO嗎?呵呵噠。真不知道西數(shù)做為國內(nèi)大型IDC服務(wù)商是如何想的,利用那些無知嗎?
3、獲取不到真實(shí)Ip
規(guī)模較大的網(wǎng)站,一般都會(huì)使用CDN加速,但是有些站點(diǎn)不僅僅對“設(shè)備”使用了CDN加速,而且還對Spider使用了加速功能。最后的結(jié)果是什么呢?如果CDN節(jié)點(diǎn)不穩(wěn)定,那么對網(wǎng)站spider來講,這個(gè)問題將是致命的。
很多大型站點(diǎn)開放CDN的原因就是容易被攻擊,這個(gè)時(shí)候如果不做“蜘蛛回源”就可想而知了。你的站點(diǎn)做了CDN了嗎?請登錄百度站長平臺(tái)查看一下spider是否可以抓取真實(shí)Ip地址吧!
4、頻繁的50X類錯(cuò)誤
這樣的鏈接其中一個(gè)共同的特點(diǎn)是:當(dāng)打開后,全部都是正常的,那么Spider為什么會(huì)報(bào)錯(cuò)提醒呢?只是因?yàn)樵谂老x發(fā)起抓取的那一刻,httpcode返回了5XX",你的站點(diǎn)是否頻繁有這樣的問題呢?有的話需要立即安排技術(shù),或者通報(bào)IDC服務(wù)商做解決了!
5、錯(cuò)誤的抓取比例
任何網(wǎng)站都做不到100%不出問題,但是萬事有一個(gè)度:我們認(rèn)為,這個(gè)比例不超過5%,對網(wǎng)站基本上是無影響的,且這樣的錯(cuò)誤不應(yīng)當(dāng)每天都出現(xiàn)。最常見的抓取錯(cuò)誤一般都是連接超時(shí):"抓取請求連接建立后,下載頁面速度過慢,導(dǎo)致超時(shí),可能原因服務(wù)器過載,帶寬不足"這種情況:
A:盡量在不影響圖片質(zhì)量的情況下,對圖片進(jìn)行壓縮,上傳的時(shí)候就進(jìn)行了壓縮。
B:減少如JS腳本文件類型的使用,或者進(jìn)行合并
C:頁面大小進(jìn)行控制,尤其是一些瀏覽量、抓取量較高的頁面,不建議超過2MB。
D:增加網(wǎng)站的帶寬,提升下載速度,或者更換服務(wù)器。
上一篇:
暫無信息更多新聞
2020
關(guān)于網(wǎng)站建設(shè),企業(yè)網(wǎng)站的作用更類似于企業(yè)在報(bào)紙和電視上所做的宣傳企業(yè)本身及品牌的廣告。不同之處在于企業(yè)網(wǎng)站容量更大,企業(yè)可以把任何想讓客戶及公
View details
2020
關(guān)于網(wǎng)站建設(shè),您不僅可以用文字、圖片、動(dòng)畫等方式宣傳自己的產(chǎn)品,而且可以介紹自己的企業(yè),發(fā)布企業(yè)新聞,介紹企業(yè)領(lǐng)導(dǎo),公布公司業(yè)績,提供售后服務(wù),舉辦產(chǎn)品
View details
2023
網(wǎng)站可以幫助攸縣公司拓展市場,吸引更多潛在客戶。通過搜索引擎優(yōu)化(SEO)和在線推廣,公司網(wǎng)站可以在搜索結(jié)果中獲得更好的排名,從而提高曝光度,并吸引更多的訪問量。
View details
2020
據(jù)國外媒體報(bào)道,2017年1月底,Mozilla旗下Firefox檢測到,通過HTTpS加密協(xié)議登錄安全界面的數(shù)據(jù)占全網(wǎng)的70%,明顯超越HTTp明文協(xié)議,這無疑是全網(wǎng)實(shí)行HTTpS安全加密協(xié)議的里程碑。意
View details